Comparativa de Aproximaciones a SVM Semisupervisado Multiclase para Clasificación de Páginas Web
نویسندگان
چکیده
In this paper we present a study for semi-supervised multiclass web page classification using SVM. We propose not only combining binary semi-supervised classifiers, but also multiclass supervised ones. Our experiments show great performance for the latter method, where ignoring unlabeled documents could be better for some cases, using only labeled documents for the learning task, directly based on supervised algorithms.
منابع مشابه
Estudio de las categorías LIWC para el análisis de sentimientos en español
Las opiniones expresadas en redes sociales o blogs son actualmente un medio en el cual se basan los usuarios para la toma de decisiones en situaciones tales como la compra de un producto o en la contratación de un servicio; recientemente, el número de opiniones expresadas ha aumentado exponencialmente en la Web. La mineŕıa de opiniones tiene como objetivo la extracción de información subjetiva ...
متن کاملOPIS: Um Método para a Identificação e a Busca de Páginas-Objeto
Este artigo propõe um novo método, denominado OPIS, para a identi cação e a busca de páginas-objeto, que são páginas que representam um único objeto do mundo real na web. A motivação para este trabalho se encontra no fato de que os motores de busca convencionais não conseguem responder a buscas por páginas-objeto de forma satisfatória atualmente, já que a quantidade de páginas-objeto recuperada...
متن کاملClasificación de servicios Web mediante una red neuronal artificial usando n-gramas de palabras
Resumen. Este artículo presenta un enfoque basado en n-gramas de palabras para la clasificación automática de servicios Web utilizando una red neuronal artificial de tipo perceptrón multicapa. Los servicios Web contienen información de gran utilidad para lograr una clasificación basada en la funcionalidad del mismo. El enfoque se basa en n-gramas de palabras extraídas de la descripción del serv...
متن کاملUso de ontologías en páginas web para mejorar su accesibilidad a invidentes
Resumen. Actualmente, la Web ofrece información disponible para las personas de forma muy heterogénea. Con la iniciativa de la Web semántica se persigue que el contenido de las páginas Web se disponga de forma que permita a personas y ordenadores “comprender” esta información, siguiendo esquemas comunes y consensuados mediante ontologías. Uno de los colectivos que más se puede favorecer de esta...
متن کاملDiseño automático de redes neuronales artificiales mediante el uso del algoritmo de evolución diferencial (ED)
Resumen—En el área de la Inteligencia Artificial, las Redes Neuronales Artificiales (RNA) han sido aplicadas para la solución de múltiples tareas. A pesar de su declive y del resurgimiento de su desarrollo y aplicación, su diseño se ha caracterizado por un mecanismo de prueba y error, el cual puede originar un desempeño bajo. Por otro lado, los algoritmos de aprendizaje que se utilizan como el ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 42 شماره
صفحات -
تاریخ انتشار 2009